隨著數據中心、機器學習和人工智能(AI)應用的快速發展,網絡設備需要快速傳輸大量數據。因此,網絡交換機的帶寬需求在過去十年中增長了超過8000%。如圖1所示,交換機的速度需求從2010年的320Gb/s增長到2022年的25.6Tb/s,并且很快將需要超過51.2Tb/s的帶寬。

圖1為了支持數據密集型應用,光設備的需求快速增長,推動了對更高性能、更高帶寬網絡交換機的需求。
如果繼續使用當前的可插拔模塊方法(即將模塊插入機架式交換機的前面板),實現超過25.6Tb/s的高通道數將極具挑戰性。在這些高帶寬下使用可插拔模塊會導致在將電信號從前面板后方傳輸到交換機ASIC(應用特定集成電路)時出現較大的能量損失,并且需要高功耗的信號處理來克服通道損傷。這些問題直接導致了高功耗以及與冷卻可插拔光收發器和交換機相關的高運營成本。
為了應對這些挑戰,消除數據傳輸瓶頸,光工程師正在開發更高效的方法,將光通道更接近電子設備。許多大型科技公司和光標準組織支持將收發器從前面板移除,創建一個將數據直接傳輸到電氣交換結構的單一封裝設備。這種技術被稱為共封裝光學(CPO)設備,可以在不顯著增加功耗或收發器占地面積的情況下增加帶寬,因為光學和電子元件直接相鄰,位于同一個封裝組件中。這種設計最小化了傳輸損耗,降低了信號處理需求,提供了最低的每比特數據傳輸功耗。
與任何新技術一樣,工程師不僅需要解決開發這些實際設備的復雜性,還需要具備能夠快速測試這些高通道密度設備功能的儀器。
本文檔概述了正在進行的工作,以確保共封裝光學設備在各種高帶寬應用中的互操作性,并討論了如何應對這一新技術帶來的測試挑戰。
確保共封裝光學(CPO)設備的互操作性與標準化
目前,光互連論壇(Optical Internetworking Forum,簡稱OIF)和板載光學聯盟(Consortium for On-Board Optics,簡稱COBO)正在迭代共封裝光學設備開發的框架和規范文檔。從高層次來看,OIF框架專注于解決光學和電氣通信接口共封裝的應用領域和技術考量。該框架還提供了許多技術考量,用于設計能夠滿足在帶寬需求增加時降低功耗目標的共封裝光學設備。
OIF還有一個相關的次要計劃,涉及外部激光源的使用,例如外部激光小型可插拔模塊(External Laser Small Form Pluggables,簡稱ELSFP),以延長共封裝光學設備的可靠性和使用壽命。COBO規范的主要目標是通過為系統制造商、集成商、組件制造商以及8通道和16通道板載光學設備的供應商提供通用規范,確保最終用戶能夠使用一致的技術平臺。
共封裝光學(CPO)設備的關鍵應用領域
OIF確定了以下三個關鍵應用領域,這些領域將從共封裝光學設備提供的低功耗和高帶寬中受益匪淺:
? 數據中心以太網網絡接口控制器(NICs)、連接服務器和存儲設備的交換機
? 用于訓練和機器學習的AI GPU接口
? Disaggregation
盡管每個應用都有其獨特的需求,并且運行在不同的環境中,但每個用例都有相同的架構需求,包括兩個具有高帶寬需求的通信端點。圖2展示了如何配置共封裝光學設備以滿足這些獨特應用的需求。

圖2: 共封裝光學設備的潛在架構,可以滿足不同應用的帶寬、延遲和可靠性需求。來源:OIF論壇
共封裝光學設備的構建模塊:3.2Tb/s光模塊
2021年,OIF啟動了一個項目,旨在為開發3.2Tb/s模塊(以及最終的6.4Tb/s模塊)提供框架,這些模塊將成為51.2Tb/s交換機的構建模塊。最終,OIF和COBO提出的架構基于51.2Tb/s交換機,其中包括16個3.2Tb/s模塊,這些模塊被安排在ASIC附近,如圖3所示。

圖3: 400GBase-FR4 3.2Tb/s模塊的系統框圖
目前,許多參與3.2Tb/s共封裝光學模塊實施項目的OIF成員正在開發400GBASE-FR4和400GBASE-DR4選項,這些選項與200G接口兼容。雖然這些設備的所有要求都詳細記錄在產品需求文檔(PRD)中,但該項目的一些關鍵指導原則包括以下內容:
? 模塊應包括數字信號處理器(DSP)、調制驅動器、跨阻放大器(TIA)芯片以及基于硅光子學的光發射/接收組合,無論操作模式如何。
? 收發器的電氣接口應基于32×106G電氣通道,符合CEI-112G-XSR標準,電氣接口速率在200BASE-FR4操作時應降至32×53G PAM4。
? 為了保持模塊尺寸盡可能緊湊,不應有內置電源單元。由于光學和電氣接口是這些模塊的關鍵組成部分,讓我們進一步探討OIF框架為這些組件提供的指導。
光學接口
根據OIF框架,共封裝光學模塊應基于現有的光學接口標準,包括VR4、SR4、DR4和FR4。如表1所示,400GBase模塊具有不同的傳輸距離、波長和通道數量。根據所選標準,需要不同的測試參數。

表1: 使用不同常見標準設計的光學接口規格概覽
由于這些光學接口所使用的標準與當今可插拔模塊所使用的標準相同,因此共封裝模塊與可插拔設備之間的互操作性得以保留。因此,數據中心可以使用帶有可插拔模塊的光纖分支電纜,以實現可插拔模塊和共封裝模塊的最佳組合,從而滿足其需求。
電氣接口
盡管共封裝應用可能會使用多種電氣接口標準,如XSR、LR、PCIe或AIB,但OIF框架主要關注使用XSR。表2中顯示了一個使用XSR的模塊示例。

表2: 使用XSR標準的模塊電氣接口規格
此外,OIF框架建議在共封裝光學模塊中可以使用以下四種電氣接口選項:
? 重定時(Retimed):使用表2中詳細描述的CEI-112G-XSR-PAM4實現,設計用于在約50毫米的第一級封裝基板上實現ASIC和光引擎之間的低誤碼率通信。
? 線性放大(Linear Amplified):在引擎中消除CDR/DSP功能以降低功耗,ASIC中的發射和接收功能具有更多的放大和峰值調整,以便SerDes能夠補償整個鏈路。
? 半重定時(Half Retimed):引擎和ASIC通信的一半進行重定時,另一半采用線性放大方法。
? 直接驅動(Direct Drive):這是一種簡化的接口,僅提供支持線性光通信通道所需的功能。
關于OIF框架和光模塊PRD中提出的電氣和光學接口規格的更多詳細信息,請參閱相關文檔。
共封裝光模塊激光器放置
隨著社區致力于開發3.2Tb/s模塊,關于激光器的放置位置——內部還是外部——存在爭議。由于激光器是模塊中最容易老化且產生大量熱量的組件,因此在使用內部激光器時,可靠性和系統散熱是需要考慮的問題。為解決可靠性問題,一個提議是在模塊中包含一個備用激光器以實現冗余。然而,這種方法的缺點是會增加模塊的尺寸,這對于許多應用來說是不理想的。
OIF社區成員也在通過之前提到的ELSFP模塊項目研究激光器的外部放置。外部激光器的放置使組裝更小,消除了使用內部激光器相關的熱挑戰,并且通常提高了模塊的可靠性。然而,使用外部激光器的最大缺點是耦合激光進入模塊的插入損耗會增加。為了補償這一點,激光器的輸出功率需要達到每個波長22dBm,這將增加能耗。
應對共封裝光學設備的三大測試挑戰
新技術的開發總會為光學工程師帶來新的測試挑戰。為了確保新設備的快速實施和部署,從資格認證到大批量生產的測試需求應該與設備開發同步進行。雖然本文的前半部分關注了共封裝光學設備開發的一些關鍵要素,但接下來的重點將轉向審視生產這種技術所面臨的三大主要測試挑戰。
挑戰1:快速執行組裝測試如前所述,共封裝光學設備由多個單獨的收發器模塊組成——例如,一個51.2Tb/s的共封裝設備包含16個3.2Tb/s的模塊。每個收發器模塊由來自一個或多個晶圓的芯片組裝而成。為了減少在組裝過程中后期出現問題的可能性,可以借鑒數十年高容量半導體制造的經驗,將其應用于共封裝光學設備所需的光測試中。讓我們來審視一下這種測試方法所需的測試階段:
? 晶圓測試
? 模塊測試
? 共封裝組裝測試
晶圓測試
晶圓測試是第一個關鍵的測試步驟,因為這是發現故障成本最低的環節。一旦投入資源將晶圓切割并制成模塊,制造商需要確保組成模塊的組件符合規格。為了確保沒有關鍵性能問題影響產量,需要在制造過程的早期進行高吞吐量的晶圓級測試。然而,對于硅光子學的測試存在諸多挑戰。
盡管晶圓測試與半導體晶圓測試有一些相似之處,但光子測試與電子測試截然不同。例如,電學測試可以通過探針卡建立導電連接來完成,但對于光測試,需要精確對準以將光耦合進出光子組件。為了實現注入和捕獲這些測試所需的光,需要通過機器人操作光學探針在晶圓周圍移動。此外,為了在高容量下進行這些測試,需要快速主動對準。Quantifi Photonics的對數模擬功率計是專為晶圓測試設計的設備的一個例子,它允許非??焖俚墓饫w對準。

圖4:一種潛在模塊配置的示例。來源:OIF論壇。
模塊測試
模塊是通過將通過晶圓測試的芯片封裝在一起,并連接模塊所需的其他元件(如激光器、放大器、調制器和信號處理所需的基本元件)組裝而成的。模塊測試是首次有機會測試一個單元的完整性能。這可以包括多種測試,例如檢查調制光信號、激光器、熱循環以及模塊的校準,還可以包括在所需傳輸距離范圍內對整個模塊進行環回測試和誤碼率測試(BERT)。
在這一級別的測試中,可能會面臨一些挑戰。首先,模塊可以使用多種不同的光和電標準,如本文第一部分所討論的,這意味著需要了解并測試每種模塊配置的不同性能標準。一開始,產量預測將決定測試站是針對單一類型的模塊(例如850nm多模的SR4)進行定制,還是應該能夠配置為處理多種類型(例如SR4和FR4,它們使用不同類型的光纖和波長)。
此外,在一個3.2Tb/s的模塊中,有8根光纖,每根光纖有8個波長,這意味著有64個通道需要測試。如果沒有支持并行測試的測試設備,就需要多個切換矩陣來在多光纖陣列的不同光纖之間切換,或者將不同波長切換到示波器中進行TDEQ測量。這種切換方法不僅耗時,而且可能會增加測試成本,因為它需要時間來切換測試。
相反,支持快速并行測試的高密度測試設備(例如我們的BERT)是一種更好的測試這些模塊的方法。通過這種高密度、多通道的測試設備,用戶可以靈活地以多種方式執行測試。例如,可以同時測試8根光纖,并對波長進行并行測試的解復用。
共封裝組裝測試
這一最終級別的測試涉及將經過充分測試的模塊與ASIC和其他必要組件集成后的測試。一些可能的共封裝組件的組裝選項如圖5所示。

圖5: 共封裝光學設備的四種不同組裝選項。來源:OIF論壇
在這一點上,需要進行功能測試,以確保所有組件都被正確集成,沒有引入制造缺陷,例如模塊錯位、光纖被夾住或端口損壞。然而,在組裝測試中,測試挑戰再次增加。例如,如果一個組裝件包含8個模塊,每個模塊有8根光纖和每根光纖8個波長,那么現在總共有512個通道需要測試。因此,如果單通道模塊測試需要一分鐘來完成,那么使用單通道測試方法測試所有512個通道是不切實際的。
因此,在生產線和商業測試測量供應商努力跟上的情況下,并行測試是一個關鍵的成功因素。能夠擴展到執行多達288通道并行測試的高密度功率計等測試設備是進行這些組件性能和光信號功率的快速測量所必需的。
挑戰2:并行組裝需要并行測試
傳統上,光學設備在所有組件組裝完成后才會進行測試。雖然這種方法可以加快設備的組裝速度,但它可能導致需要增加測試覆蓋率,并且會對產量產生不利影響。相反,最好在設備組裝過程中進行測試,因為這種方法可以即時提供反饋,以確保組裝成功。
讓我們來看一個簡單的例子,比較這兩種測試方法。如果使用傳統的“先組裝后測試”方法來組裝一個帶有MPO-24光纖帶的設備,那么在組裝過程中進行測試可能只會對光纖帶中的一個光纖進行測試,以確保組裝方法有效。假設這種組裝方法對其他光纖也有效,但實際上,為了優化其中一個光纖的性能,可能會犧牲其他23個通道的性能。然而,如果使用能夠進行并行組裝和測試的設備,就可以優化整個光纖帶的組裝。為此,需要能夠提供多通道測試的測試儀器,例如激光器、功率計、衰減器和光開關。
挑戰3:消除被占用的儀器
在進行并行測試時,確保測試儀器的最優利用是一個棘手的問題。在并行測試操作中,很容易出現被占用的儀器,或者儀器在測試站中被低效使用的情況。例如,當使用光譜分析儀(OSA)進行測試時,可能只需要80毫秒,而使用其他儀器進行PAM4 TDEQ測試可能需要數十秒。在這種情況下,僅需要80毫秒的儀器大部分時間可能會閑置。
為了最大化儀器利用率并降低測試系統的總成本,最好優化測試流程,將串行和并行測試結合起來使用。這種測試方法需要靈活的光開關來拆分并行端口,或者同時移動并行端口,以提供從并行通道中提取某些通道或將通道移動所需的靈活性。
克服當前的測試挑戰并為未來做好準備
為了滿足許多應用對帶寬需求的快速增長,同時不顯著增加能源消耗和網絡應用的占地面積,共封裝光學設備是一個有前景的解決方案。盡管許多組織正在合作開發這些模塊所需的技術,但必須考慮并克服這些設備當前和未來的測試挑戰。
在Quantifi Photonics,我們認識到提供高通道數、高密度測試設備的緊迫性,這將有助于推動共封裝光學設備的廣泛采用。我們已經推出了幾款能夠滿足部分測試需求的產品,并制定了詳細的路線圖,以幫助解決這些測試的瓶頸問題。作為我們的愿景的一部分,我們致力于幫助光子學行業實現通常在電氣半導體測試中常見的全自動化水平。我們設想的未來是,高吞吐量測試不僅成為可能,而且使用的測試儀器還將提供方便且緊湊的形式,幫助公司繼續優化其測試設置并快速創新。